tg-me.com/nlp_stuff/105
Last Update:
دیتاست NLU فارسی
این نوزده نفر اومدند زحمت کشیدند و دیتاست NLU فارسی درست کردند که برای اولین بار بتونیم یک بنچمارک در این زمینه داشته باشیم و مدلها را مقایسه کنیم. سایز بعضی از قسمتهاش مثل پرسش و پاسخ کمه (۵۷۵ تا) اما واقعا شروع خیلی خوبیه. روش مدل خودشون را هم ارائه کردند. این دیتاست شامل ایناست:
Textual Entailment
Query Paraphrasing
Reading Comprehension
Multiple-Choice QA
Machine Translation
Sentiment Analysis
بعضی از ایدهها و منابعشون خیلی خیلی قشنگ بود. وقت و انرژی گذاشتند و لیبل زدند. دمشون گرم.
لینک مقاله و گیتشون در ادامه آوردیم. استار بدید حتما:
https://github.com/persiannlp/parsinlu
https://arxiv.org/pdf/2012.06154.pdf
پ.ن. اگر میخواهید اسمتون بمونه، شروع کنید دیتاست متنی فارسی درست کنید.
#irani
#read
#paper
#dataset
@nlp_stuff
BY NLP stuff

Share with your friend now:
tg-me.com/nlp_stuff/105